實用的RAG系統：從知識庫到檢索增強生成：超越訓練截止點：為何大語言模型需要外部知識

大型語言模型能流暢地生成語言，但流暢性並不等同於事實可靠性。大語言模型的根本限制在於其對參數記憶——即訓練結束時凍結於時間點上的知識，稱為訓練截止點。

RAG之所以存在，是因為許多實際問題依賴於資訊，這些資訊具有私密性、新近性、版本化、領域專屬性或可審計性。若無外部知識，模型將面臨以下困境：

開卷模式

我們不應強迫模型透過昂貴的重新訓練來「記住」所有內容，而是轉變架構，先從外部語料庫中檢索特定證據，再讓大語言模型在有證據支援的情況下作答。這提供了有證據支持的信心而非沒有證據的支持。